EDINET API
API仕様書を google driveにあげておいた(仕様が変化するかもだけど、閲覧しやすくで)
日付指定(必須)で、その日の提出書類の一覧
dateの指定は必須。
typeはオプション
1: default メタデータのみ
2: 実際の一覧の情報が取れる
responseに書類管理番号(docID)があるので、これを後で使う。
提出者(filerName)とタイトル(docDescrption)を表示
$ jq '.results|.[]|(.filerName + " " + .docID + ":" + .docDescription)' < ret.json
これで、該当の報告書(情報) を getする。
typeの指定も必須。
1が本文、監査報告書、XBRLがまとめて、zipで来る
2はPDF(ウェブ上の検索一覧で表示されるPDFのことらしいが、よく知らず)
3は添付書類も含めたPDFなので、2より情報リッチなもののよう
4は英文ファイル.提出が無い場合は、404が帰ってくる?
--no-check-certificateは、、、解消しておきたいので、
EDINETの利用で一番大変なのは、XBRLのparseだと思うけど、downloadも大きな関門だったので、一つハードルが下がった印象。